Day 26：AI 輔助資安工具整合（自動化與流水線）

2025 iThome 鐵人賽

自我挑戰組

利用生成式AI等工具來學習資安系列第 26 篇

17th鐵人賽

Chinnn

2025-10-18 23:02:34

124 瀏覽

分享至

今日目標（3 項）

瞭解如何把生成式 AI（LLM）與現有資安工具（log parser、tcpdump、sqlmap、pwntools）整合成自動化流程。

實作一個簡易流水線：由 AI 讀取輸出（例如 log 或封包片段）並回傳初步分析結果（可疑 IP / payload 建議）。

定義輸入/輸出格式與安全審核點（哪些輸出要人工覆核，哪些可自動化處理）。

今日實作步驟（直接照做）

建資料夾 ~/ai_security/day26，準備兩個檔案：sample.log（或 http_packet.txt）與 pipeline.py（初始空檔）。

撰寫一個最簡化的 pipeline（Python），流程如下：

讀入 sample.log（或 http_packet.txt）。

用簡單 regex 抽取候選 IOC（IP、URL、User-Agent）。

把抽取結果拼成 prompt，呼叫 LLM（或模擬 LLM 回覆）要求「把 IOC 分級並給 3 條優先處理建議」。

將 LLM 回覆存成 report.json（包含 raw_ioc、llm_analysis、confidence_hint）。

在 pipeline.py 中加入「人工審核」步驟：若 LLM 回覆含有高風險建議或命令（關鍵字：exploit, delete, rce），則把該項標示為 needs_review: true 並停止自動化下一步。

執行 pipeline（本地模擬 LLM 或把 prompt 貼到 ChatGPT），取得 report.json，並人工審核標示項目。

把程式碼、sample.log、與 report.json 上傳或貼出來讓我幫你檢查。

範例程式片段（核心邏輯，可直接貼入 pipeline.py）

import re, json

def extract_ioc(log_text):
    ips = re.findall(r'\b(?:[0-9]{1,3}\.){3}[0-9]{1,3}\b', log_text)
    urls = re.findall(r'https?://[^\s"]+', log_text)
    uas = re.findall(r'\"[^\"]*\"$', log_text, re.M)  # 簡易抓 User-Agent
    return {"ips": list(set(ips)), "urls": list(set(urls)), "uas": list(set(uas))}

log = open('sample.log','r',encoding='utf-8').read()
iocs = extract_ioc(log)
prompt = f"以下是我抓到的 IOC：{json.dumps(iocs,ensure_ascii=False)}。請幫我將 IOC 分為高/中/低風險，並給每個 IOC 一句處置建議（不要生成可執行 exploit）。"
print(prompt)  # 把這個 prompt 貼到 ChatGPT 或你選的 LLM
# 假裝得到回覆後，寫成 report.json（示範）
report = {"raw_ioc": iocs, "llm_analysis": "（此處放 LLM 的回覆）", "needs_review": False}
with open('report.json','w',encoding='utf-8') as f:
    json.dump(report,f,ensure_ascii=False,indent=2)

風險 / 注意事項

LLM 可能會產生「看起來合理但錯誤」的結論（hallucination），所有高風險處置必須人工覆核。

絕對不要把真實敏感憑證或未脫敏的個資貼到公有 LLM；必要時先做去識別化（masking）。

若 pipeline 建議「執行命令」，請加上審核機制或只輸出建議文字而非指令。

今天實作 AI 與資安工具的整合流水線：從 log 抽取 IOC、生成 prompt 到 LLM 分析並輸出 report.json。我學會設計自動化流程的同時加入人工審核點（needs_review），以防止 LLM 幻覺或危險建議直接自動化執行。整合後能快速得到初步分析，節省人工過濾時間，但高風險項仍需人工判斷與處理。